VIP STUDY сегодня – это учебный центр, репетиторы которого проводят консультации по написанию самостоятельных работ, таких как:
  • Дипломы
  • Курсовые
  • Рефераты
  • Отчеты по практике
  • Диссертации
Узнать цену
Главная / Рефераты / Факторный анализ.

Факторный анализ.

Факторный анализ — это совокупность методов, которые на основе объективно существующих корреляционных взаимосвязей признаков (или объектов) позволяют выявлять латентные (или скрытые) обобщающие характеристики структуры изучаемых объектов и их свойств. В ходе проведения маркетингового исследования можно столкнуться с множеством переменных, большинство из которых взаимосвязаны. Для удобства обработки данных их число следует снизить до приемлемого уровня. С этой целью связи между коррелированными переменными анализируют и представляют в виде небольшого числа факторов. В дисперсионном анализе, множественной регрессии и дискриминантном анализе в качестве зависимой переменной рассматривается одна переменная, а остальные являются независимыми (предикторами). Однако в факторном анализе такого разграничения не делают. Поэтому факторный анализ — это скорее метод анализа взаимозависимости (interdependence technique), поскольку в факторном анализе проверяются всевозможные варианты взаимозависимых связей. Подобная цель достигается за счет использования выгод частичного совпадения информации, содержащейся в коррелирующих переменных, в результате чего происходит извлечение ключевой информации в виде всего нескольких факторов. Главными целями факторного анализа являются: (1) сокращение числа переменных (редукция данных) и (2) определение структуры взаимосвязей между переменными, т.е. классификация переменных. Поэтому факторный анализ используется или как метод сокращения данных или как метод классификации. Факторный анализ широко используется в маркетинговых исследованиях. • При сегментации рынка для определения латентных переменных с целью группировки потребителей. • При разработке товарной стратегии факторный анализ используется для определения характеристик торговой марки, влияющих на выбор потребителей. • При разработке рекламной стратегии маркетологи с помощью факторного анализа пытаются понять, каким передачам отдают предпочтение потребители целевого рынка. • При разработке стратегии ценообразования факторный анализ определяет характеристики потребителей, чувствительных к цене. Факторный анализ в его классическом варианте разработан для данных, полученных при измерениях по интервальным шкалам. Это ограничение связано с предположениями формальной модели, на которой базируется классический факторный анализ. Считают, что изучаемый объект описывается набором признаков x1,x2,…xn (n – общее число используемых признаков), т. е. информация о нем может быть представлена в форме матрицы данных «объект-признак» (xij), N = 1, 2, ..., n, где xij – значение j-го признака xj, на i-м объекте, N – общее число объектов. Каждому признаку xj поставим в соответствие признак zj, являющийся приведением первого признака к стандартной форме в результате следующего преобразования: , где и соответственно среднее значение и стандартное отклонение признака xj. Признаки xj, заданные в стандартной форме, имеют нулевое среднее и единичную дисперсию. Основное предположение анализа факторного заключается в том, что каждый наблюдаемый признак можно выразить в виде суммы некоторых других, не наблюдаемых признаков (факторов), умноженных каждый на свой коэффициент. Эти коэффициенты принято называть факторными нагрузками. Значения факторных нагрузок, как правило, и являются результатом вычислительной процедуры анализа факторного, т. е. именно они служат основой для содержательных выводов. Указанное предположение можно выразить следующим образом: , где Fp – р-й общий фактор (р меняется от 1 до m), m – количество общих факторов, Uj – j-й характерный фактор, ajp – факторная нагрузка р-го общего фактора на j-й признак, dj – факторная нагрузка j-го характерного фактора. Факторы принято разделять на общие (Fp) и характерные (Uj). Отличие характерных факторов от общих заключается в том, что каждый характерный фактор имеет ненулевое значение только для одного наблюдаемого признака. Количество общих факторов (m) предполагается существенно меньшим количества исходных признаков (n). Обычные допущения, позволяющие придать указанной модели статистический смысл, заключаются в следующем: факторы представляют собой случайные величины с нормальным законом распределения, заданные в стандартной форме; характерные факторы независимы как между собой, так и по отношению к общим факторам. При этих предположениях появляется возможность определения с помощью различного рода статистических процедур факторных нагрузок по наблюдаемым значениям исходных признаков. Зная значения факторных нагрузок и исходных признаков, можно вычислить для каждого объекта значения факторов и тем самым перейти к более экономному описанию. Вместе с тем из указанных предположений следует, что анализ факторный в его классическом варианте применим лишь для количественных данных (факторы предполагаются непрерывными и имеющими нормальное распределение). В рамках введенной линейной нормальной модели анализа факторного обычно предполагаются некоррелированными между собой не только характерные, но и общие факторы. В этом случае оказываются справедливыми следующие соотношения: ; , где , , – факторные нагрузки р-го фактора соответственно на j-й, k-й и l-й признаки, – коэффициент корреляции между k-м и l-м признаками. В правой части соотношения стоят квадраты факторных нагрузок. Каждое слагаемое определяет обусловленную соответствующим фактором долю дисперсии наблюдаемого признака, т. е. вся дисперсия может быть разделена на две части: дисперсию, обусловленную наличием общих факторов (сумму квадратов общих факторов принято называть общностью), и дисперсию, обусловленную вариацией характерного фактора (квадрат нагрузки характерного фактора обычно называют характерностью). Из соотношения следует, что коэффициент корреляции между двумя любыми исходными признаками выражается через факторные нагрузки общих факторов. Таким образом, факторы могут интерпретироваться в качестве латентных признаков, детерминирующих значения наблюдаемых признаков и обусловливающих наличие корреляции между ними. К статистикам и понятиям, используемым в факторном анализе, относятся: Критерий сферичности Бартлетта. Статистика, проверяющая гипотезу о том, что переменные в генеральной совокупности не коррелируют между собой. Другими словами, корреляционная матрица в совокупности является характерной матрицей; каждая переменная коррелирует сама с собой (r = 1), но не взаимосвязана с другими переменными (r = 0). Корреляционная матрица. Матрица попарных корреляций r между всеми возможными парами переменных, включенных в анализ. Это симметричная, неотрицательно определенная матрица. Общность. Доля дисперсии отдельной переменной, которую переменная делит с другими рассматриваемыми переменными. Это доля дисперсии, объясняемая общими факторами. Собственное значение. Представляет полную дисперсию, объясняемую каждым фактором. Факторные нагрузки. Линейные корреляции между переменными и факторами. Матрица факторных нагрузок. Содержит факторные нагрузки всех переменных по всем выделенным факторам. Значения фактора. Суммарные значения, определенные для каждого респондента по производным факторам. Критерий адекватности выборки Кайзера—Мейера—Олкина. Коэффициент для проверки целесообразности выполнения факторного анализа. Высокие значения (от 0,5 до 1) указывают, что факторный анализ целесообразен. Малые значения (до 0,5) указывают, что факторный анализ неприемлем. Процент дисперсии. Процент от полной дисперсии, приписываемый каждому фактору. Остатки. Разница между наблюдаемыми корреляциями, приведенными в исходной корреляционной матрице, и вычисленными корреляциями, определенными из матрицы факторных нагрузок. Графическое изображение критерия «каменистой осыпи». График зависимости собственных значений от числа факторов в порядке их убывания. Процедура выполнения факторного анализа состоит из следующих этапов (рисунок 5.8). Рисунок 5.8. Процедура факторного анализа. 1. Формулировка проблемы. Формулировка проблемы включает несколько задач. Необходимо четкое определение целей факторного анализа. Переменные, подвергаемые факторному анализу, задаются исходя из прошлых исследований, теоретических выкладок и по усмотрению исследователя. Важно, чтобы переменные измерялись в интервальной или относительной шкале. Выборка должна быть подходящего размера. Опыт подсказывает, что рекомендуется брать выборку, по крайней мере, в четыре или пять раз больше, чем число переменных. 2. Построение корреляционной матрицы. В основе факторного анализа лежит матрица корреляций между переменными. Ее анализ дает маркетологам ценную информацию. Целесообразность выполнения факторного анализа определяется наличием корреляций между переменными. На практике так обычно и бывает. Если же корреляции между всеми переменными небольшие, то факторный анализ бесполезен. Следует также ожидать, что переменные, тесно взаимосвязанные между собой, должны также тесно коррелировать с одним и тем же фактором или факторами. Для проверки целесообразности использования факторной модели для анализа зависимости переменных существует несколько статистик. С помощью критерия сферичности Бартлетта проверяется нулевая гипотеза об отсутствии корреляций между переменными в генеральной совокупности: другими словами, рассматривается утверждение о том, что корреляционная матрица совокупности — это единичная матрица, в которой все диагональные элементы равны 1, а все остальные равны 0. Проверка с помощью критерия сферичности основана на преобразовании детерминанта корреляционной матрицы в статистику хи-квадрат. При большом значении статистики нулевую гипотезу отклоняют. Если же нулевую гипотезу не отклоняют, то целесообразность выполнения факторного анализа вызывает сомнения. Другая полезная статистика — критерий адекватности выборки Кайзера—Мейера—Олкина (КМО). Данный коэффициент сравнивает значения наблюдаемых коэффициентов корреляции со значениями частных коэффициентов корреляции. Небольшие значения КМО-статистики указывают на то, что корреляции между парами переменных нельзя объяснить другими переменными и что использование факторного анализа нецелесообразно. 3. Определение метода факторного анализа. При применении факторного анализа к реальным данным все факторные нагрузки, которые в совокупности можно рассматривать как матрицу факторных нагрузок, и характерности являются неизвестными и должны быть определены. Эта задача решается на основе соотношений и , в которые подставляются корреляции, определяемые по исходным данным. Вместе с тем из анализа соотношений и можно сделать вывод, что существует бесконечно много матриц факторных нагрузок, удовлетворяющих этим соотношениям и получаемых одна из другой в результате специальных преобразований (ортогональных вращений) системы факторов. Неоднозначность решения задачи нахождения матрицы факторных нагрузок обусловливает существование достаточно большого числа специальных способов поиска одного из допустимых решений. Вычислительные процедуры, отражающие содержание этих методов, реализованы в стандартных программах, которые входят в большинство пакетов статистического анализа данных. Матрицы факторных нагрузок, получаемые в результате применения тех или иных методов факторного анализа, определяются содержащимися в их процедурах ограничениями на возможные комбинации искомых нагрузок (как предпосылки для нахождения единственного решения). Поэтому с формальной точки зрения различные решения эквивалентны в том смысле, что они удовлетворяют в рамках постулируемой факторной модели всем ее исходным предложениям. В то же время при содержательной интерпретации эти решения могут оказаться существенно различными. Различные методы факторного анализа различают в зависимости от подходов, используемых для выделения коэффициентов значения факторов. Существует два основных метода — анализ главных компонент и анализ общих факторов. При анализе главных компонент учитывают всю дисперсию данных. Диагональ корреляционной матрицы состоит из единиц, и вся дисперсия.введена в матрицу факторных нагрузок. Анализ главных компонент рекомендуется выполнять, если основная задача исследователя — определение минимального числа факторов, которые вносят максимальный вклад в дисперсию данных, чтобы в последующем использовать их в многомерном анализе. Эти факторы называют главными компонентами. В анализе общих факторов факторы определяют только на основании общей дисперсии. Общности располагаются на диагонали корреляционной матрицы. Этот метод подходит, если основной задачей является определение латентных переменных и общей дисперсии. Этот метод также известен как разложение матрицы. Существуют и другие методы оценки общих факторов. Они включают: метод невзвешенных наименьших квадратов, обобщенный метод наименьших квадратов, метод максимального правдоподобия, альфа-факторный метод, метод распознавания образов. Эти методы сложнее, и их не рекомендуется использовать неопытным аналитикам. 4. Определение числа факторов. Для определения числа факторов могут быть использованы следующие процедуры. Определение, основанное на предварительной информации. Иногда, руководствуясь предварительной информацией, исследователь знает, сколько факторов можно ожидать, и таким образом, может заранее определить число выделяемых факторов. После извлечения желаемого числа факторов их выделение прекращают. Определение, основанное на собственных значениях факторов. В этом методе учитывают только факторы, собственные значения которых выше 1,0; остальные факторы в модель не включают. Собственное значение представляет значение дисперсии, обусловленной действием этого фактора. Следовательно, рассматривают только факторы с дисперсией выше 1,0. Если число переменных меньше 20, то этот метод завышает число факторов. Определение, основанное на критерии «каменистой осыпи». Графическое изображение критерия «каменистой осыпи» представляет собой график зависимости собственных значений факторов от их номеров в порядке выделения. Для определения числа факторов используют форму графика. Обычно график имеет четкий разрыв между крутой частью кривой, где факторам свойственны большие собственные значения, и плавной хвостовой частью кривой, связанной с остальными факторами (в этом месте убывание собственных значений факторов слева направо максимально замедляется). Это плавное убывание собственных значений называется осыпь. Опыт показывает, что точка, с которой начинается осыпь, указывает на действительное число факторов. Обычно число факторов, определенное по графику «каменистой осыпи», на единицу или несколько единиц больше числа факторов, полученных методом, основанным на собственных значениях. Определение на основе процента объясненной дисперсии. В этом методе число выделяемых факторов определяют так, чтобы кумулятивный процент дисперсии, выделяемой факторами, достиг удовлетворительного уровня. Какой уровень дисперсии считать удовлетворительным, зависит от поставленной задачи. Однако рекомендуется выделять такое число факторов, которое объясняют, по крайней мере, 60% дисперсии. Определение, основанное на оценке надежности, выполняемой расщеплением. В этом методе выборку расщепляют напополам и факторный анализ выполняют для каждой половины. При этом оставляют только факторы с высокой степенью соответствия факторных нагрузок в двух подвыборках. Определение, основанное на критериях значимости. Можно определить статистическую значимость отдельных собственных значений и оставить только статистически значимые факторы. Недостаток этого метода в том, что при больших размерах выборок (больше 200) многие факторы, вероятно, статистически значимые, хотя с практической точки зрения, многие из них объясняют небольшую долю полной дисперсии. 5. Вращение факторов. Важный результат факторного анализа — матрица факторных нагрузок, также называемая матрицей факторного отображения. Она содержит коэффициенты, используемые для выражения нормированных переменных через факторы. Эти коэффициенты, называемые факторными нагрузками, представляют корреляции между факторами и переменными. Коэффициент с высоким абсолютным значением показывает, что фактор и переменная тесно взаимосвязаны. Коэффициенты матрицы факторных нагрузок можно использовать для интерпретации факторов. Несмотря на то, что матрица исходных или неповернутых факторов указывает на взаимосвязь факторов и отдельных переменных, она редко приводит к факторам, которые можно интерпретировать, поскольку факторы коррелируют со многими переменными. Поэтому вращением матрицу факторных коэффициентов преобразуют в более простую, которую легче интерпретировать. При вращении факторов желательно, чтобы каждый фактор имел ненулевые или значимые нагрузки (коэффициенты) только для небольшого числа переменных. Аналогично, желательно, чтобы каждая переменная имела ненулевые или значимые нагрузки с небольшим числом фактором, если можно, то с одним фактором. Если несколько факторов имеют высокие значения факторных нагрузок с одной и той же переменной, то их трудно интерпретировать. Вращение не влияет на общности и процент объясненной полной дисперсии. Однако процент дисперсии, обусловленной влиянием каждого фактора, изменяется. Формирование новых линейных комбинаций может быть выполнено разными методами. Почти все эти методы пытаются получить значения факторных нагрузок, близких к 0 или 1, так как такие нагрузки более наглядно показывают, какие процессы развиваются совместно, и в этом смысле облегчают проведение интерпретации. Когда переменная не коррелирует с фактором (то есть коэффициент корреляции близок к 0 или не превосходит по величине 0,3), то мы можем считать эту переменную не имеющей значения для интерпретации фактора. Напротив, когда корреляции переменной с фактором является существенной (то есть коэффициент корреляции близок к 1 или хотя бы превышает 0,5), то мы можем считать, что для интерпретации фактора эта переменная может иметь большое значение. Различные методы вращения отличаются между собой, требуется задать критерий, который должен выполняться при получении модифицированных значений факторных нагрузок. При осуществлении факторного анализа могут использоваться как ортогональные, так и неортогональные варианты вращения. Ортогональное вращение – это вращение факторов, при котором сохраняется прямоугольная система координат. В результате ортогонального вращения получают некоррелированные факторы. Метод варимакс (или вращение, максимизирующее дисперсию) – это ортогональный метод вращения факторов, который минимизирует число переменных с высокими значениями нагрузок, усиливая тем самым интерпретируемость факторов. Вращение варимакс является простой и надежной процедурой, которая обычно позволяет добиться значительного упрощения интерпретации факторов и поэтому имеет самое широкое распространение среди всех схем ортогональной ротации. Неортогональное (косоугольное) вращение – это вращение факторов, при котором не сохраняется прямоугольная система координат и в результате вращения получают коррелированные факторы. Иногда, допустив некоторую корреляцию между факторами, можно упростить матрицу факторной модели. Косоугольное вращение используется тогда, когда факторы в генеральной совокупности, вероятно, тесно взаимосвязаны. 6. Интерпретация факторов. Обычная процедура содержательной интерпретации матрицы факторных нагрузок заключается в следующем. Нагрузки, относящиеся к одному фактору, располагаются в порядке убывания абсолютных значений. Рассматриваются признаки, имеющие максимальные абсолютные значения факторных нагрузок. Далее анализируется семантика этой группы признаков, их «экономический смысл». Выявляется общее содержание этой группы признаков, то общее свойство, которое, по мнению исследователя, объединяет признаки в одну группу. Это свойство (группа свойств) затем получает название и фигурирует в качестве фактора. Для достижения этой цели придерживаются следующей процедуры. А) Начинают с первой переменной и первого фактора в подвергнутой вращению матрице факторных нагрузок и двигаются в горизонтальном направлении слева направо в поисках наибольшего коэффициента корреляции. Обводят этот коэффициент. По очереди повторяют эту процедуру для каждой из остальных переменных. Б) Исследуют каждый из обведенных коэффициентов и оцените его значимость. Значимость коэффициента нагрузки может проверяться с помощью либо статистического, либо практического критерия. Смысл соответствия статистическому критерию состоит в том, что коэффициент нагрузки должен обладать статистической значимостью при заданном значении альфа, обычно равном 0,05. Другими словами, для выборок, состоящих менее чем из 100 элементов, коэффициент нагрузки должен быть более 0,30, для того чтобы считаться статистически значимым. Смысл соответствия практическому критерию состоит в том, что рассматриваемый фактор учитывает определенный процент вариации переменной. С этой точки зрения коэффициент нагрузки, равный 0,30, указывает на то, что доля вариации переменной, учитываемой данным фактором, составляет 9%. Обычно пороговая величина коэффициента нагрузки, позволяющая считать его значимым, находится в пределах 30%-35%. В) Находят другие значимые коэффициенты нагрузки, используя критерий, выбранный на предыдущем этапе. Г) Исследуют матрицу нагрузок и идентифицируют все те переменные, которые не имеют значимых нагрузок ни для одного из факторов. Необходимо предполагать, что каждая переменная будет иметь значимую нагрузку хотя бы для одного фактора. Однако если это предположение не, соответствует действительности, у аналитика могут быть два варианта действий: (1) интерпретировать решение таким, каким оно является в действительности, и игнорировать переменные, не имеющие сколько-нибудь значительной нагрузки; (2) критически оценить каждую из переменных, не обеспечивающую значимую нагрузку ни на один фактор. Эта оценка должна проводиться с точки зрения общего вклада переменной в исследование, а также ее показателя относительной дисперсии. Если переменная не имеет большой важности для цели исследования или имеет невысокое значение относительной дисперсии, то аналитик может исключить эту переменную из рассмотрения и найти решение с помощью нового фактора. Д) Концентрируют внимание на значимых коэффициентах нагрузки и пытаются назвать факторы на той общей основе, которую имеют переменные, обеспечивающие значимые нагрузки. Переменные, обеспечивающие значимые нагрузки более чем для одного фактора, усложняют задачу наименования и становятся кандидатами на исключение — в зависимости от цели исследования, а также от того, действительно ли смешанные типы нагрузки имеют реальный смысл или указывают на наличие фундаментальных проблем использования переменной. 7. Определение степени соответствия модели. Основное допущение, лежащее в основе факторного анализа, состоит в том, что наблюдаемая корреляция между переменными может быть свойственна общим факторам. Следовательно, корреляции между переменными можно вывести или воспроизвести из определенных корреляций между переменными и факторами. Изучив разности между наблюдаемыми корреляциями (данными в исходной корреляционной матрице) и вычисленными корреляциями (определенными из матрицы факторных нагрузок), можно определить соответствие модели исходным данным. Эти разности называют остатками. Если много остатков с большими значениями, то факторная модель не обеспечивает хорошее соответствие данным и требует пересмотра. Общая формула расчета корреляций выглядит следующим образом: , где j и i обозначают исходные переменные, p соответствует номеру фактора, ajp равняются значениям корреляции (нагрузки) между j-й переменной и p-м фактором.

Каталог работ Узнать цену


Похожие рефераты:

Отзывы

Незаменимая организация для занятых людей. Спасибо за помощь. Желаю процветания и всего хорошего Вам. Антон К.

Далее
Узнать цену Вашем городе
Выбор города
Принимаем к оплате
Информация
Наши преимущества:

Оформление заказов в любом городе России
Оплата услуг различными способами, в том числе через Сбербанк на расчетный счет Компании
Лучшая цена
Наивысшее качество услуг

Сезон скидок -20%!

Мы рады сообщить, что до конца текущего месяца действует скидка 20% по промокоду Скидка20%